自我监督图像生成中普遍的方法是在像素级表示上操作。尽管这种方法可以产生高质量的图像,但它不能从矢量化的简单性和先天质量中受益。在这里,我们提出了一个以图像的冲程级表示作用的绘图代理。在每个时间步骤中,代理商首先评估当前画布,并决定是停止还是继续绘画。当做出“抽奖”决定时,代理输出一个程序,指示要绘制的中风。结果,它通过使用最小数量的笔触并动态决定何时停止,从而产生最终的栅格图像。我们通过对MNIST和Omniglot数据集进行强化学习来培训我们的代理,以无条件生成和解析(重建)任务。我们利用我们的解析代理在Omniglot挑战中进行典范生成和类型的条件概念生成,而无需进行任何进一步的培训。我们在所有三代任务和解析任务上提供了成功的结果。至关重要的是,我们不需要任何中风级别或矢量监督;我们只使用栅格图像进行训练。
translated by 谷歌翻译